智能论文笔记

Generative Modelling of the Ageing Heart with Cross-Sectional Imaging and Clinical Data

Mengyun Qiao , Berke Doga Basaran , Huaqi Qiu , Shuo Wang , Yi Guo , Yuanyuan Wang , Paul M. Matthews , Daniel Rueckert , Wenjia Bai

分类：计算机视觉 | 机器学习

2022-08-28

心血管疾病是全球死亡的主要原因，是一种与年龄有关的疾病。了解衰老期间心脏的形态和功能变化是一个关键的科学问题，其答案将有助于我们定义心血管疾病的重要危险因素并监测疾病进展。在这项工作中，我们提出了一种新型的条件生成模型，以描述衰老过程中心脏3D解剖学的变化。提出的模型是灵活的，可以将多个临床因素（例如年龄，性别）整合到生成过程中。我们在心脏解剖学的大规模横截面数据集上训练该模型，并在横截面和纵向数据集上进行评估。该模型在预测衰老心脏的纵向演化和对其数据分布进行建模方面表现出了出色的表现。

translated by 谷歌翻译

HTML版本

Distincive Image Captioning via CLIP Guided Group Optimization

Youyuan Zhang , Jiuniu Wang , Hao Wu , Wenjia Xu

分类：计算机视觉

2022-08-08

图像字幕模型通常是根据人体注释的地面真实字幕训练的，该字幕可能会产生准确但通用的字幕。为了提高字幕模型的独特性，我们首先提出了一系列使用大规模视觉语言预训练模型剪辑来评估标题的独特性。然后，我们提出了一种简单有效的训练策略，该策略通过在相似图像组中进行比较来训练模型。我们对各种现有模型进行了广泛的实验，以证明我们的策略的广泛适用性以及基于公制的结果与人类评估的一致性。通过将最佳模型的性能与现有的最新模型进行比较，我们声称我们的模型实现了针对独特性目标的新最先进的。

translated by 谷歌翻译

Improved post-hoc probability calibration for out-of-domain MRI segmentation

Cheng Ouyang , Shuo Wang , Chen Chen , Zeju Li , Wenjia Bai , Bernhard Kainz , Daniel Rueckert

分类：计算机视觉

2022-08-04

深层模型的概率校准是在安全至关重要的应用（例如医学成像）中非常可取的。它通过将预测概率与测试数据中的实际准确性对齐，使深网的输出概率可解释。在图像分割中，精心校准的概率使放射科医生可以识别模型预测的分割不可靠的区域。这些不可靠的预测通常是由成像伪影或看不见的成像协议引起的室外（OOD）图像。不幸的是，大多数用于图像分割的先前校准方法在OOD图像上表现出色。为了减少面对OOD图像的校准误差，我们提出了一个新型的事后校准模型。我们的模型利用当地级别的扰动的像素敏感性以及在全球层面的形状先验信息。该模型在心脏MRI分割数据集上进行了测试，这些数据集包含来自看不见的成像协议中看不见的成像伪像和图像。与最新的校准算法相比，我们证明了校准误差减少。

translated by 谷歌翻译

Multi-dimension Geospatial feature learning for urban region function recognition

Wenjia Xu , Jiuniu Wang , Yirong Wu

分类：计算机视觉

2022-07-18

城市地区功能识别在监测和管理有限的城市地区时起着至关重要的特征。由于城市功能很复杂，并且充满了社会经济属性，因此只需使用配备物理和光学信息的遥感图像（RS）图像就无法完全解决分类任务。另一方面，随着移动通信和互联网的发展，对地理空间大数据（GBD）的获取变得可能是可能的。在本文中，我们建议使用高维GBD数据与RS图像结合使用以用于城市区域功能识别的RS图像，提出了多维特征学习模型〜（MDFL）。当提取多差异功能时，我们的模型考虑了由其活动建模的用户相关信息以及从区域图中抽象的基于区域的信息。此外，我们提出了一个决策融合网络，该网络集成了来自多个神经网络和机器学习分类器的决策，并且最终决定是考虑RS图像中的视觉提示以及GBD数据中的社交信息。通过定量评估，我们证明我们的模型达到92.75的总体准确性，表现优于最先进的时间10％。

translated by 谷歌翻译

Generative Myocardial Motion Tracking via Latent Space Exploration with Biomechanics-informed Prior

Chen Qin , Shuo Wang , Chen Chen , Wenjia Bai , Daniel Rueckert

分类：计算机视觉

2022-06-08

心肌运动和变形是表征心脏功能的丰富描述符。图像注册是心肌运动跟踪最常用的技术，是一个不当的反问题，通常需要先前对解决方案空间进行假设。与大多数现有的方法相反，它们强加了明确的通用正则化（例如平滑度），在这项工作中，我们提出了一种新的方法，该方法可以隐式地学习了特定于应用程序的生物力学知识，并将其嵌入了神经网络参数化转换模型中。尤其是，提出的方法利用基于变异自动编码器的生成模型来学习生物力学上合理变形的多种多样。然后，可以通过穿越学习的歧管来搜索最佳转换时，在考虑序列信息时搜索最佳转换。该方法在三个公共心脏Cine MRI数据集中进行了验证，并具有全面的评估。结果表明，所提出的方法可以胜过其他方法，从而获得更高的运动跟踪精度，并具有合理的量保存和更好地变化数据分布的概括性。它还可以更好地估计心肌菌株，这表明该方法在表征时空特征以理解心血管疾病方面的潜力。

translated by 谷歌翻译

Differentiable and Scalable Generative Adversarial Models for Data Imputation

Yangyang Wu , Jun Wang , Xiaoye Miao , Wenjia Wang , Jianwei Yin

分类：机器学习

2022-01-10

数据估算已被广泛探索以解决缺失的数据问题。显着增加的不完整数据量使得归纳模型在许多现实生活中的计算上不可行。在本文中，我们提出了一个名为SCI的有效可扩展的估算系统，以显着加速在大规模不完整数据的准确性保证下进行可分解的生成对抗性归档模型的培训。 SCI包括两个模块，可差异的拒绝建模（DIM）和样本量估计（SSE）。 Dim利用新的遮蔽沉降角分歧功能，使任意生成的逆势归零模型可微分，而对于这种可分辨动的载体模型，SSE可以估计适当的样本大小，以确保用户指定的最终模型的借调准确性。在几个现实生活中的大规模数据集上进行了广泛的实验证明，我们的提出系统可以通过7.1倍加速生成的对抗性模型培训。使用大约7.6％的样本，SCIS在计算时间较短的情况下，使用最先进的估算方法产生竞争精度。

translated by 谷歌翻译

Smooth Nested Simulation: Bridging Cubic and Square Root Convergence Rates in High Dimensions

Wenjia Wang , Yanyuan Wang , Xiaowei Zhang

分类： (统计)机器学习

2022-01-09

嵌套模拟涉及通过模拟估算条件期望的功能。在本文中，我们提出了一种基于内核RIDGE回归的新方法，利用作为多维调节变量的函数的条件期望的平滑度。渐近分析表明，随着仿真预算的增加，所提出的方法可以有效地减轻了对收敛速度的维度诅咒，只要条件期望足够平滑。平滑度桥接立方根收敛速度之间的间隙（即标准嵌套模拟的最佳速率）和平方根收敛速率（即标准蒙特卡罗模拟的规范率）。我们通过来自投资组合风险管理和输入不确定性量化的数值例子来证明所提出的方法的性能。

translated by 谷歌翻译

QU-BraTS: MICCAI BraTS 2020 Challenge on Quantifying Uncertainty in Brain Tumor Segmentation -- Analysis of Ranking Metrics and Benchmarking Results

Raghav Mehta , Angelos Filos , Ujjwal Baid , Chiharu Sako , Richard McKinley , Michael Rebsamen , Katrin Dätwyler , Raphael Meier , Piotr Radojewski , Gowtham Krishnan Murugesan

分类：计算机视觉 | 机器学习

2021-12-19

深度学习（DL）模型为各种医学成像基准挑战提供了最先进的性能，包括脑肿瘤细分（BRATS）挑战。然而，局灶性病理多隔室分割（例如，肿瘤和病变子区）的任务特别具有挑战性，并且潜在的错误阻碍DL模型转化为临床工作流程。量化不确定形式的DL模型预测的可靠性，可以实现最不确定的地区的临床审查，从而建立信任并铺平临床翻译。最近，已经引入了许多不确定性估计方法，用于DL医学图像分割任务。开发指标评估和比较不确定性措施的表现将有助于最终用户制定更明智的决策。在本研究中，我们探索并评估在Brats 2019-2020任务期间开发的公制，以对不确定量化量化（Qu-Brats），并旨在评估和排列脑肿瘤多隔室分割的不确定性估计。该公制（1）奖励不确定性估计，对正确断言产生高置信度，以及在不正确的断言处分配低置信水平的估计数，（2）惩罚导致更高百分比的无关正确断言百分比的不确定性措施。我们进一步基准测试由14个独立参与的Qu-Brats 2020的分割不确定性，所有这些都参与了主要的Brats细分任务。总体而言，我们的研究结果证实了不确定性估计提供了分割算法的重要性和互补价值，因此突出了医学图像分析中不确定性量化的需求。我们的评估代码在HTTPS://github.com/ragmeh11/qu-brats公开提供。

translated by 谷歌翻译

Understanding Square Loss in Training Overparametrized Neural Network Classifiers

Tianyang Hu , Jun Wang , Wenjia Wang , Zhenguo Li

分类： (统计)机器学习 | 机器学习

2021-12-07

深入学习在现代分类任务中取得了许多突破。已经提出了众多架构用于不同的数据结构，但是当涉及丢失功能时，跨熵损失是主要的选择。最近，若干替代损失已经看到了深度分类器的恢复利益。特别是，经验证据似乎促进了方形损失，但仍然缺乏理论效果。在这项工作中，我们通过系统地研究了在神经切线内核（NTK）制度中的过度分化的神经网络的表现方式来促进对分类方面损失的理论理解。揭示了关于泛化误差，鲁棒性和校准错误的有趣特性。根据课程是否可分离，我们考虑两种情况。在一般的不可分类案例中，为错误分类率和校准误差建立快速收敛速率。当类是可分离的时，错误分类率改善了速度快。此外，经过证明得到的余量被证明是低于零的较低，提供了鲁棒性的理论保证。我们希望我们的调查结果超出NTK制度并转化为实际设置。为此，我们对实际神经网络进行广泛的实证研究，展示了合成低维数据和真实图像数据中方损的有效性。与跨熵相比，方形损耗具有可比的概括误差，但具有明显的鲁棒性和模型校准的优点。

translated by 谷歌翻译

Group-based Distinctive Image Captioning with Memory Attention

Jiuniu Wang , Wenjia Xu , Qingzhong Wang , Antoni B. Chan

分类：计算机视觉 | 自然语言处理 | 机器学习

2021-08-20

描述使用自然语言的图像被广泛称为图像标题，这是由于计算机视觉和自然语言生成技术的发展而达成了一致的进展。虽然传统的标题模型基于流行度量的高精度，即BLEU，苹果酒和香料，探索了标题与其他类似图像中的标题的能力。为了产生独特的标题，一些先驱采用对比学习或重新加权地面真理标题，其侧重于一个输入图像。然而，忽略了类似图像组中对象之间的关系（例如，相同专辑中的项目或属性或细粒度事件中的物品）。在本文中，我们使用基于组的独特标题模型（Gdiscap）来提高图像标题的独特性，其将每个图像与一个类似的组中的其他图像进行比较，并突出显示每个图像的唯一性。特别是，我们提出了一种基于组的内存注意力（GMA）模块，其存储在图像组中是唯一的对象特征（即，与其他图像中的对象的低相似性）。生成字幕时突出显示这些唯一的对象功能，从而产生更有独特的标题。此外，选择地面标题中的独特单词来监督语言解码器和GMA。最后，我们提出了一种新的评估度量，独特的单词率（Diswordrate）来测量标题的独特性。定量结果表明，该方法显着提高了几种基线模型的独特性，并实现了精度和独特性的最先进的性能。用户学习的结果与定量评估一致，并证明了新的公制Diswordrate的合理性。

translated by 谷歌翻译